1. Descripción de las muestras y metodología

6 muestras de células mononucleares (CD45+) de lámina propia de intestino delgado de ratón.

Se analizaron dos cepas de ratón:

  • Wiltype (WT) (n = 3)

  • IgA knockout (IgA-KO) (n = 3)

Análisis single-cell RNA-seq:

  • Procesamiento de datos: Cell ranger v.6.1

  • Genoma de referencia: refdata-gex-mm10-2020-A

Análisis de los datos: paquete de R Seurat v5.

2. Controles de calidad

2.1. Estadísticas antes del filtrado de células

a) Info general

Sample Strain Cells nCount_mean nCount_min nCount_max nFeature_mean nFeature_min nFeature_max
11_IgAKO IgAKO 6845 3077.177 500 158902 979.8203 200 5939
2_IgAKO IgAKO 1995 4469.529 500 46489 1321.3243 206 5588
8_IgAKO IgAKO 7430 4015.943 500 67754 1100.2750 204 6342
13_WT WT 6920 3186.953 499 76629 1114.0805 201 6771
14_WT WT 9787 3575.914 502 55093 1214.2241 213 6241
7_WT WT 9139 4553.522 487 65523 1115.5712 202 5665

b) Gráficos

Features

Counts

% genes mitocondriales

Features / counts

% genes mitocontriales / counts

2.2. Criterio de filtrado

  • Número mínimo de features (RNA): 200
  • Número máximo de features (RNA): 5000
  • Porcentaje máximo de genes mitocontriales: 5
  • Número máximo de counts: 7.5^{4}

2.3. Estadísticas después del filtrado

a) Info general

Sample Strain Cells nCount_mean nCount_min nCount_max nFeature_mean nFeature_min nFeature_max
11_IgAKO IgAKO 6184 3119.209 500 51313 999.9712 220 4810
2_IgAKO IgAKO 1145 5801.045 501 43541 1486.2236 206 4943
8_IgAKO IgAKO 6817 4079.613 500 55955 1126.7964 208 4956
13_WT WT 6721 3183.038 499 54735 1121.2285 201 4914
14_WT WT 9604 3493.390 502 41431 1207.3095 251 4990
7_WT WT 8314 4866.712 487 65523 1166.5345 218 4985

b) Gráficos

Features

Counts

% genes mitocondriales

Features / counts

% genes mitocontriales / counts

3. Integración

Los diferentes dataset en formato de objeto Seurat se sometieron a un merging y a una normalización mediante el método SCTransform.

Luego, antes de proceder a la integración de los datasets, se realizó una reducción de dimensiones de los datos mediante Principal Component Analysis (PCA), del cual se seleccionaron algunas dimensiones para los análisis subsecuentes tomando como base el Elbow plot del PCA (ver apartado 3.1).

La integración de los datos se realizó siguiendo tres métodos diferentes: Harmony, CCA y RPCA. Se realizó una reducción visual de los datos mediante UMAP antes y después de las distintas integraciones para ofrecer una representación preliminar de un posible clustering de los datos (la resolución óptima se estudiará más adelante).

3.1 PCA

  • Número de dimensiones elegidas: 18
  • Resolución UMAP: 0.1

3.2. Antes de la integración de las muestras

Umap previo a la integración

3.3. Pruebas de integración

a) Harmony integration

UMAP completo

UMAP por cepa

UMAP por muestra

b) CCA integration

UMAP completo

UMAP por cepa

UMAP por muestra

c) RPCA integration

UMAP completo

UMAP por cepa

UMAP por muestra

4. Controles adicionales: expresión de Malat1

Finalmente, se eligió la integración mediante el método Harmony para realizar los análisis consecuentes.

La expresión del gen Malat1 se ha asociado a la presencia/ausencia de intrones en datasets de expresión, y el estudio de su nivel de expresión se ha propuesto como medida adicional de calidad.

En este caso, nos basaremos en el estudio de Monstserrat Ayuso y Esteve-Codina y reflejaremos las células divididas en tres grupos: a) “cells” (expresión normalizada de Malat1 esperable, entre 0 y 3.5), b) Cytosolic debris (expresión de 0), y c) Nuclei enriched (expresión >3.5).

4.1. Grupo de “cells” (entre 0 y 3.5 counts)

4.2. Grupo de “cytosolic debris” (0 counts)

Las células con 0 counts aparecen destacadas en azul.

4.3. Grupo de “nuclei enriched” (más de 3.5 counts)